Il Quadro Matematico
L'obiettivo principale è trovare un vettore $x \in \mathbb{R}^n$ tale che la combinazione lineare $Ax = x_1a_1 + \dots + x_na_n$ approssimi al meglio $b$. Questo viene spesso indicato come la regressione di $b$ sui regressori (le colonne di $A$).
Ci concentriamo sul vettore residuo $r = Ax - b$. Nella pratica, assumiamo un sistema sovradeterminato dove $m > n$. Perché? Perché quando $m = n$ e $A$ è non singolare, il punto ottimo è semplicemente $A^{-1}b$, che produce un errore nullo—un caso banale per l'ottimizzazione.
Variazioni Canonicali
A seconda del tipo di errore che vogliamo penalizzare, scegliamo diverse norme:
Il metodo più comune. Minimizza la somma dei quadrati dei residui: $\|Ax - b\|_2^2$. È sensibile agli outlier estremi ma offre una soluzione analitica tramite le equazioni normali.
Minimizza il massimo assoluto residuo $\max_i |r_i|$. Viene utilizzato quando ogni misurazione deve rimanere entro un limite rigoroso. Può essere risolto tramite il seguente programma lineare (PL):
minimizza $t$
soggetto a $-t\mathbf{1} \preceq Ax - b \preceq t\mathbf{1}$
Minimizza $\sum |r_i|$. Questo approccio è robusto agli outlier, poiché non eleva al quadrato gli errori. Può anche essere risolto tramite un PL:
minimizza $\mathbf{1}^T t$
soggetto a $-t \preceq Ax - b \preceq t$
Contesto di Stima
In molti campi ingegneristici, assumiamo che uno stato reale $x$ sia oscurato dal rumore: $y = Ax + v$. Il nostro obiettivo è trovare una stima $\hat{x} = \text{argmin}_z \|Az - y\|$. Scegliendo la norma, facciamo implicitamente un'ipotesi sulla distribuzione statistica del rumore $v$.